智能论文笔记

Byzantines can also Learn from History: Fall of Centered Clipping in Federated Learning

Kerem Ozfatura , Emre Ozfatura , Alptekin Kupcu , Deniz Gunduz

分类：机器学习 | 人工智能 | (统计)机器学习

2022-08-21

由于其在广泛的协作学习任务中的成功，联邦学习框架的普及程度越来越多，也引起了有关学习模型的某些安全问题，因为恶意客户可能参与学习过程。因此，目的是消除恶意参与者的影响，并确保最终模型是可信赖的。关于拜占庭攻击的一个常见观察结果是，客户的模型/更新之间的差异越高，隐藏攻击的空间就越多。为此，最近已经表明，通过利用动量，从而减少了方差，可以削弱已知的拜占庭攻击的强度。居中的剪裁框架（ICML 2021）进一步表明，除了降低差异外，从上一个迭代中的动量项可以用作中和拜占庭式攻击并显示出对知名攻击的令人印象深刻的表现。但是，在这项工作的范围内，我们表明居中的剪裁框架具有某些漏洞，并且可以根据这些漏洞来修订现有的攻击，以规避居中的剪裁防御。因此，我们介绍了一种设计攻击的策略，以规避居中的剪裁框架，并通过将测试准确性降低到最佳场景中的5-40，从而在数值上说明了其针对中心剪裁的有效性以及其他已知的防御策略。

translated by 谷歌翻译

SplitGuard: Detecting and Mitigating Training-Hijacking Attacks in Split Learning

Ege Erdogan , Alptekin Kupcu , A. Ercument Cicek

分类：机器学习

2021-08-20

分布式深度学习框架（例如分裂学习）在培训深神经网络的计算成本以及一组数据持有人的集体数据的隐私性利用方面为巨大的好处。特别是，通过将神经网络分配在客户端和服务器之间，以便客户端计算初始图层集，并且服务器计算其余的。但是，此方法引入了试图窃取客户端数据的恶意服务器的唯一攻击向量：该服务器可以将客户端模型引导到学习其选择的任何任务，例如倾向于输出易于可逆值。有了一个已经提出的具体示例（Pasquini等，CCS '21），这种训练式攻击攻击构成了分裂学习客户的数据隐私的重大风险。在本文中，我们提出了SplitGuard，该方法可以通过这种方法来检测该方法是否是通过训练式攻击攻击的目标。我们通过实验评估方法的有效性，将其与潜在的替代方案进行比较，并详细讨论与其使用相关的各个点。我们得出的结论是，Splitguard可以有效地检测训练式攻击，同时最大程度地减少对手回收的信息量。

translated by 谷歌翻译

UnSplit: Data-Oblivious Model Inversion, Model Stealing, and Label Inference Attacks Against Split Learning

Ege Erdogan , Alptekin Kupcu , A. Ercument Cicek

分类：机器学习

2021-08-20

培训深度神经网络通常会迫使用户在分布式或外包环境中工作，并伴随着隐私问题。 Split学习旨在通过在客户端和服务器之间分配模型来解决这一问题。该方案据说提供了隐私，因为服务器无法看到客户端的模型和输入。我们表明，通过两次新颖的攻击，这是不正确的。（1）我们表明，只有掌握客户端神经网络体系结构知识的诚实但充满感染的分裂学习服务器可以恢复输入样本并获得与客户端模型的功能相似的模型，而无需检测到。（2）我们证明，如果客户端仅隐藏模型的输出层以“保护”专用标签，则诚实但有趣的服务器可以完全准确地推断出标签。我们使用各种基准数据集测试我们的攻击，并反对提议的隐私增强扩展以分裂学习。我们的结果表明，明文分裂学习可能会带来严重的风险，从数据（输入）隐私到知识产权（模型参数），并且不仅仅提供虚假的安全感。

translated by 谷歌翻译

Deep Architectures for Content Moderation and Movie Content Rating

Fatih Cagatay Akyon , Alptekin Temizel

分类：计算机视觉 | 机器学习

2022-12-08

Rating a video based on its content is an important step for classifying video age categories. Movie content rating and TV show rating are the two most common rating systems established by professional committees. However, manually reviewing and evaluating scene/film content by a committee is a tedious work and it becomes increasingly difficult with the ever-growing amount of online video content. As such, a desirable solution is to use computer vision based video content analysis techniques to automate the evaluation process. In this paper, related works are summarized for action recognition, multi-modal learning, movie genre classification, and sensitive content detection in the context of content moderation and movie content rating. The project page is available at https://github.com/fcakyon/content-moderation-deep-learning}.

translated by 谷歌翻译

Sequence Models for Drone vs Bird Classification

Fatih Cagatay Akyon , Erdem Akagunduz , Sinan Onur Altinuc , Alptekin Temizel

分类：计算机视觉 | 机器学习

2022-07-21

由于无人机成本降低并且无人机技术有所改善，无人机检测已成为对象检测的重要任务。但是，当对比度较弱，远距离可见度较弱时，很难检测到遥远的无人机。在这项工作中，我们提出了几个序列分类体系结构，以减少无人机轨道检测到的假阳性比率。此外，我们提出了一个新的无人机与鸟类序列分类数据集，以训练和评估拟议的架构。3D CNN，LSTM和基于变压器的序列分类体系结构已在拟议的数据集上进行了培训，以显示提出的思想的有效性。如实验所示，使用序列信息，鸟类分类和整体F1分数可以分别提高73％和35％。在所有序列分类模型中，基于R（2+1）D的完全卷积模型可产生最佳的转移学习和微调结果。

translated by 谷歌翻译

Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection

Fatih Cagatay Akyon , Sinan Onur Altinuc , Alptekin Temizel

分类：计算机视觉 | 机器学习

2022-02-14

在现场遥远的小物体和物体的检测是监视应用中的一个重大挑战。此类对象由图像中的少量像素表示，并且缺乏足够的细节，因此很难使用常规检测器检测到它们。在这项工作中，提出了一个称为切片辅助超推理（SAHI）的开源框架，该框架提供了一种通用切片的辅助推理和用于小对象检测的微调管道。提出的技术是通用的，因为它可以在任何可用的对象检测器之上应用于而无需任何微调。实验评估，使用对象检测基线在Visdrone和Xview Aerial对象检测数据集上表明，FCO，VFNET和TOOD检测器分别将对象检测方法分别增加6.8％，5.1％和5.3％。此外，通过切片辅助微调可以进一步提高检测准确性，从而导致累计增加12.7％，13.4％和14.5％的AP按照相同的顺序。拟议的技术已与DestectRon2，MMDetection和Yolov5模型集成在一起，并在https://github.com/obss/sahi.git上公开获得。

translated by 谷歌翻译

Class Distance Weighted Cross-Entropy Loss for Ulcerative Colitis Severity Estimation

Gorkem Polat , Ilkay Ergenc , Haluk Tarik Kani , Yesim Ozen Alahdab , Ozlen Atug , Alptekin Temizel

分类：人工智能 | 计算机视觉

2022-02-09

在用于测量溃疡性结肠炎的内窥镜活性的评分系统中，例如蛋黄酱内窥镜评分或溃疡性结肠炎内镜指数严重程度，水平随疾病活动的严重程度而增加。分数之间的相对排名使其成为序数回归问题。另一方面，大多数研究都使用分类跨凝结损失函数来训练深度学习模型，这对于顺序回归问题并不是最佳的。在这项研究中，我们提出了一种新颖的损失函数，即距离距离加权的跨凝结（CDW-CE），该函数尊重类的顺序，并在计算成本时考虑了类的距离。实验评估表明，经过CDW-CE训练的模型优于训练的模型，该模型训练了用于序数回归问题的常规分类横向和其他常用损失函数。此外，经过CDW-CE损失训练的模型的类激活图具有更大的歧视性，并且域专家发现它们更合理。

translated by 谷歌翻译

Automated question generation and question answering from Turkish texts using text-to-text transformers

Fatih Cagatay Akyon , Devrim Cavusoglu , Cemil Cengiz , Sinan Onur Altinuc , Alptekin Temizel

分类：机器学习

2021-11-11

虽然考试风格的问题是一家提供各种目的的基本型教育工具，但有问题的手动构建是一个复杂的过程，需要培训，经验和资源。为减少与人工建设相关的开支并满足不需要持续供应新问题，可以使用自动问题（QG）技术。但是，与自动问题应答（QA）相比，QG是一个更具挑战性的任务。在这项工作中，我们在QA，QG的多任务设置中微调多语言T5（MT5）变压器，并使用土耳其QA DataSet回答提取任务。据我们所知，这是第一个尝试从土耳其语文本执行自动文本到文本问题的学术工作。评估结果表明，拟议的多任务设置达到了最先进的土耳其语问题应答和问题绩效，而不是TQuadv1，TQuadv2数据集和XQuad土耳其分裂。源代码和预先训练的模型可在https://github.com/obss/turkish-question-generation中获得。

translated by 谷歌翻译